Aprovechando la regularidad de la dinámica local para habilidades reutilizables en RL jerárquico fuera de línea
Descubre cómo la regularidad local facilita la creación de habilidades reutilizables en el aprendizaje por refuerzo jerárquico offline. Una técnica clave para mejorar el rendimiento en RL.